import pandas as pd
import os

# 当前目录
current_dir = os.path.dirname(os.path.abspath(__file__))

# 要检查的文件名
file_name = "外研版三年级起点四年级上_单词表.csv"
file_path = os.path.join(current_dir, file_name)

# 检查文件是否存在
if not os.path.exists(file_path):
    print(f"文件未找到: {file_path}")
    exit()

# 读取CSV文件
print(f"正在读取文件: {file_name}")
df = pd.read_csv(file_path, encoding='utf-8-sig')

# 显示文件信息
print(f"文件包含 {len(df)} 行，{len(df.columns)} 列")
print(f"\n列名: {', '.join(df.columns)}")

# 显示前10行数据
print("\n前10行数据:")
print(df.head(10).to_string(index=False))

# 按单元分组统计
if '单元' in df.columns:
    print("\n各单元单词数量统计:")
    unit_counts = df['单元'].value_counts().sort_index()
    for unit, count in unit_counts.items():
        print(f"- {unit}: {count}个单词")